dplyrIlustración de Allison Horst.
select()rename()filter()arrange()mutate()group_by() + summarize()%>%)Nos quedamos con solo algunas columnas de la base.
La función a utilizar es select().
everything() es una función de ayuda muy útil:La función es rename().
El segundo argumento toma la forma ānombre_nuevo = nombre_antiguoā.
Nos quedamos con solo algunas filas de la base, de acuerdo a una condición lógica.
La función es filter().
| operador | descripción |
|---|---|
== |
es igual a |
!= |
es distinto a |
> |
es mayor a |
< |
es menor a |
>= |
es mayor o igual a |
<= |
es menor o igual a |
& |
intersección |
| |
unión |
%in% |
estĆ” contenido en |
Podemos cambiar el orden en las filas de un data frame.
La función es arrange().
Ilustración de Allison Horst.
La función es mutate().
A partir de una sola variable:
summarize() podemos hacer resĆŗmenes para toda la base (agregarla/colapsarla):## # A tibble: 1 x 1
## prom_desemp
## <dbl>
## 1 7.04
summarize(df_aprob,
prom_desemp = mean(unemp),
prom_crec = mean(gdp_growth),
prom_aprob = mean(net_approval))## # A tibble: 1 x 3
## prom_desemp prom_crec prom_aprob
## <dbl> <dbl> <dbl>
## 1 7.04 3.77 15.3
summarize(df_aprob_por_pais,
prom_desemp = mean(unemp),
prom_crec = mean(gdp_growth),
prom_aprob = mean(net_approval))## # A tibble: 17 x 4
## country prom_desemp prom_crec prom_aprob
## <chr> <dbl> <dbl> <dbl>
## 1 Argentina 11.0 2.72 16.7
## 2 Bolivia 3.70 4.24 11.3
## 3 Brazil 8.35 3.4 34.2
## 4 Chile 8.18 4.33 5.71
## 5 Colombia 12.5 4.35 27.1
## # ⦠with 12 more rows
%>%) nos ayudan con esto.df_aprob_pib_pc_alto <- df_aprob %>%
mutate(pib_pc = wdi_gdp / wdi_pop) %>%
filter(pib_pc > mean(pib_pc))df_aprob_pib_pc_alto <- df_aprob %>%
mutate(pib_pc = wdi_gdp / wdi_pop) %>%
filter(pib_pc > mean(pib_pc))f1() %>% f2(), la pipe toma el output de f1 y lo entrega como input al primer argumento de f2.df_aprob %>%
group_by(country) %>%
summarize(prom_desemp = mean(unemp),
prom_crec = mean(gdp_growth),
prom_aprob = mean(net_approval))## # A tibble: 17 x 4
## country prom_desemp prom_crec prom_aprob
## <chr> <dbl> <dbl> <dbl>
## 1 Argentina 11.0 2.72 16.7
## 2 Bolivia 3.70 4.24 11.3
## 3 Brazil 8.35 3.4 34.2
## 4 Chile 8.18 4.33 5.71
## 5 Colombia 12.5 4.35 27.1
## # ⦠with 12 more rows